# xpath 是在xml文档中搜索内容的一门语言
# xpath 可以根据节点的关系去查找内容
# html是xml的子集

# 安装lxml模块
# pip install lxml

#etree 包含xpath的功能
from lxml import etree

xml = """
<book>
    <id>1</id>
    <name>周大枪</name>
    <a href = "zhouda">周大</a>
</book>
"""

tree = etree.XML(xml)
# /表示层级关系，第一个/表示根节点
# /text()表示获取节点里面的内容
# 两斜杠表示 book 和 name节点之间可以有任意个节点
# name[1]表示第一个name
result = tree.xpath("/book//name[1]/text()")
# 获取指定属性值的标签下的内容
result2 = tree.xpath("/book/a[@href = 'zhouda']/text()")
# 获取标签属性值
result3 = tree.xpath("/book/a/@href")
print(result)
print(result2)
print(result3)

